Exploración de los datos abiertos de COVID-19 México


Síguenos en nuestra página de Facebook "Análisis y visualización de datos"

https://www.facebook.com/An%C3%A1lisis-y-visualizaci%C3%B3n-de-datos-100602148375744/?ti=as

Introducción

La pandemia COVID-19 es uno de las peores situaciones que nos ha tocado vivir en México y en el mundo en los últimos años. Si bien, podemos obtener información acerca de la situación de esta pandemia en nuestro país en las conferencias emitidas diariamente, siempre quedan preguntas o nos surge algún interés en particular. Para esto, la Secretaría de Salud en su página de COVID publica los datos abiertos que utilizan para realizar algunos de los los análisis que muestran diario. El tener disponibles estos datos nos permite explorar más allá de lo que nos muestran, resolver nuestros propios intereses y tratar de estar mejor informados y cuestionarnos acerca de lo que los medios informan.

En esta ocasión, decidí trabajar en los los Datos Abiertos de COVID-19 para poder compartirlo con ustedes, presentando distintas visualizaciones que nos ayuden a entender como ha ido evolucionando la pandemia en el pais y mantenernos informados en algo que es de interés público. Al mismo tiempo, si tienen alguna duda, interés en explorar algo o comentarios acerca del análisis, me pueden dejar sus comentarios en nuestra página de Facebook "Análisis y visualización de datos". El análisis lo estoy actualizando periódicamente.

Cabe aclarar que en esta exploración de los datos de COVID19 no muestro modelos ni predicciones ya que no estoy especializado en cuestiones epidemiológicas.

En una vista rápida de los datos, con un formato más completo, podemos ver la siguente información:

FECHA_ACTUALIZACION ID_REGISTRO ORIGEN SECTOR ENTIDAD_UM SEXO ENTIDAD_NAC ENTIDAD_RES TIPO_PACIENTE FECHA_INGRESO ... OBESIDAD RENAL_CRONICA TABAQUISMO OTRO_CASO RESULTADO MIGRANTE PAIS_NACIONALIDAD PAIS_ORIGEN UCI MUNICIPIO
0 2020-08-26 0c0819 2 ESTATAL 27 MUJER TABASCO TABASCO AMBULATORIA 2020-06-29 ... NO SI NO NO POSITIVO NO ESPECIFICADO México 99 NO APLICA CENTRO
1 2020-08-26 121414 2 IMSS 23 MUJER YUCATAN QUINTANA ROO AMBULATORIA 2020-04-08 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO APLICA BENITO JUÁREZ
2 2020-08-26 01ccf8 2 IMSS 14 HOMBRE JALISCO JALISCO HOSPITALIZADO 2020-05-03 ... NO NO SI NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO GUADALAJARA
3 2020-08-26 1493f5 2 IMSS 9 HOMBRE CIUDAD DE MEXICO MEXICO AMBULATORIA 2020-04-22 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA CUAUTITLÁN
4 2020-08-26 02820b 2 ESTATAL 8 HOMBRE CHIHUAHUA CHIHUAHUA HOSPITALIZADO 2020-05-18 ... SI NO NO NO POSITIVO NO ESPECIFICADO México 99 NO JUÁREZ

5 rows × 35 columns

Exploración de los datos

Los datos contienen a todos los sujetos que se han analizado hasta el momento (confirmados, negativos y pendientes).

El siguiente resultado contiene el número de sujetos(renglones) y el número de variables (columnas) presente:

(1291083, 35)

La tabla contiene las siguientes columnas las cuales pueden revisar para generar nuevas preguntas dependiendo de su interés.

Index(['FECHA_ACTUALIZACION', 'ID_REGISTRO', 'ORIGEN', 'SECTOR', 'ENTIDAD_UM',
       'SEXO', 'ENTIDAD_NAC', 'ENTIDAD_RES', 'TIPO_PACIENTE', 'FECHA_INGRESO',
       'FECHA_SINTOMAS', 'FECHA_DEF', 'INTUBADO', 'NEUMONIA', 'EDAD',
       'NACIONALIDAD', 'EMBARAZO', 'HABLA_LENGUA_INDIG', 'DIABETES', 'EPOC',
       'ASMA', 'INMUSUPR', 'HIPERTENSION', 'OTRA_COM', 'CARDIOVASCULAR',
       'OBESIDAD', 'RENAL_CRONICA', 'TABAQUISMO', 'OTRO_CASO', 'RESULTADO',
       'MIGRANTE', 'PAIS_NACIONALIDAD', 'PAIS_ORIGEN', 'UCI', 'MUNICIPIO'],
      dtype='object')

Antes de continuar, debemos aclarar algunas variables presentes en los datos que estan realacionadas con fechas:

  • FECHA_ACTUALIZACIÓN: Corresponde a la fecha de los datos publicados.
  • FECHA_INGRESO: Fecha en la que el paciente ingreso al hospital.
  • FECHA_SINTOMAS: Fecha en la que el paciente empezó con los síntomas.
  • FECHA_DEF: Presenta fecha sí el paciente desafortunadamente falleció.

Datos generales

A partir de la tabla anterior ocupamos la columna RESULTADO para contar a los sujetos con resultado a la prueba de COVID-19 positivos, negativos o pendientes.

Número de personas confirmadas con COVID-19: 573888
Número de personas con resultado negativo a COVID-19: 635729
Número de personas que esperan un resultado de la prueba de COVID-19: 81466
Número de fallecimientos con COVID-19 positivo: 62076
Número de sujetos analizados hasta el momento: 1291083

Algo que notamos en los datos es la presencia de sujetos que tienen una confirmación en la prueba de COVID-19, pero que su fecha de SINTOMAS fue antes de los primeros casos de COVID-19 en México (finales de Febrero).

En una conferencia se aclaró que estas incosistencias se deben a errores al momento de registrar los datos.

FECHA_ACTUALIZACION ID_REGISTRO ORIGEN SECTOR ENTIDAD_UM SEXO ENTIDAD_NAC ENTIDAD_RES TIPO_PACIENTE FECHA_INGRESO ... OBESIDAD RENAL_CRONICA TABAQUISMO OTRO_CASO RESULTADO MIGRANTE PAIS_NACIONALIDAD PAIS_ORIGEN UCI MUNICIPIO
5972 2020-08-26 044a42 2 SSA 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO AMBULATORIA 2020-02-27 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA GUSTAVO A. MADERO
12713 2020-08-26 05f3d3 1 SSA 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-02-27 ... NO NO SI SI POSITIVO NO ESPECIFICADO México 99 SI IZTAPALAPA
20731 2020-08-26 17235f 2 IMSS 19 HOMBRE NUEVO LEON NUEVO LEON AMBULATORIA 2020-01-13 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO APLICA SAN NICOLÁS DE LOS GARZA
22960 2020-08-26 135d2f 2 SSA 25 HOMBRE CIUDAD DE MEXICO HIDALGO AMBULATORIA 2020-02-27 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA PACHUCA DE SOTO
28627 2020-08-26 189846 2 SSA 15 HOMBRE CIUDAD DE MEXICO MEXICO AMBULATORIA 2020-02-28 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA TLALNEPANTLA DE BAZ
134366 2020-08-26 18ecd7 2 ISSSTE 9 HOMBRE CIUDAD DE MEXICO MEXICO HOSPITALIZADO 2020-04-01 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 SI NEZAHUALCÓYOTL
154728 2020-08-26 1732a3 2 IMSS 2 MUJER BAJA CALIFORNIA BAJA CALIFORNIA HOSPITALIZADO 2020-04-14 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO TIJUANA
173254 2020-08-26 04f68c 2 PRIVADA 15 HOMBRE NO ESPECIFICADO MEXICO HOSPITALIZADO 2020-03-04 ... NO NO NO NO POSITIVO NO ESPECIFICADO Italia 99 NO HUIXQUILUCAN
173344 2020-08-26 0aad01 2 SSA 7 MUJER CIUDAD DE MEXICO CHIAPAS AMBULATORIA 2020-02-29 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA TUXTLA GUTIÉRREZ
190500 2020-08-26 0f634f 1 IMSS 25 MUJER SINALOA SINALOA AMBULATORIA 2020-01-29 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO APLICA CULIACÁN
233215 2020-08-26 06e286 2 SSA 5 MUJER COAHUILA DE ZARAGOZA COAHUILA DE ZARAGOZA AMBULATORIA 2020-02-28 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 NO APLICA TORREÓN
264646 2020-08-26 194f98 2 ISSSTE 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-02-27 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 NO MIGUEL HIDALGO
623361 2020-08-26 178775 2 SSA 21 MUJER PUEBLA PUEBLA AMBULATORIA 2020-04-02 ... NO NO NO SI PENDIENTE NO ESPECIFICADO México 99 NO APLICA IZÚCAR DE MATAMOROS
623956 2020-08-26 003ca9 2 IMSS 22 HOMBRE QUERETARO QUERETARO AMBULATORIA 2020-02-07 ... NO NO NO NO ESPECIFICADO PENDIENTE NO ESPECIFICADO México 99 NO APLICA QUERÉTARO
626364 2020-08-26 12a243 2 SSA 9 MUJER CIUDAD DE MEXICO CIUDAD DE MEXICO AMBULATORIA 2020-02-24 ... NO NO NO NO PENDIENTE NO ESPECIFICADO México 99 NO APLICA TLALPAN
627000 2020-08-26 063f1e 2 IMSS 20 HOMBRE OAXACA OAXACA AMBULATORIA 2020-01-30 ... NO NO NO NO ESPECIFICADO PENDIENTE NO ESPECIFICADO México 99 NO APLICA NAZARENO ETLA
629350 2020-08-26 06cf4c 2 SSA 21 MUJER PUEBLA PUEBLA AMBULATORIA 2020-03-30 ... NO NO NO NO PENDIENTE NO ESPECIFICADO México 99 NO APLICA PUEBLA
631905 2020-08-26 114288 2 IMSS 19 MUJER NUEVO LEON NUEVO LEON HOSPITALIZADO 2020-05-15 ... SI SI SI NO ESPECIFICADO PENDIENTE NO ESPECIFICADO México 99 NO LINARES

18 rows × 35 columns

Como primera visualización podemos ver una gráfica de barras los valores NEGATIVOS, POSITIVOS y PENDIENTES por día.

Confirmados con COVID-19

La columna ENTIDAD_RES contiene la entidad en donde se encontraba el sujeto al momento de registrar sus datos.

Podemos agrupar los datos y presentarlos en una tabla con un gradiente para mostrar los Estados con mayor número de casos de COVID-19.

ENTIDAD TOTAL
0 CIUDAD DE MEXICO 94200
1 MEXICO 65787
2 GUANAJUATO 29602
3 VERACRUZ DE IGNACIO DE LA LLAVE 27520
4 TABASCO 27448
5 NUEVO LEON 27314
6 PUEBLA 25951
7 TAMAULIPAS 23655
8 SONORA 21027
9 COAHUILA DE ZARAGOZA 20506
10 JALISCO 19033
11 SAN LUIS POTOSI 16847
12 BAJA CALIFORNIA 16235
13 SINALOA 15647
14 GUERRERO 14337
15 MICHOACAN DE OCAMPO 14144
16 YUCATAN 14059
17 OAXACA 13176
18 QUINTANA ROO 9995
19 HIDALGO 9822
20 CHIHUAHUA 7477
21 BAJA CALIFORNIA SUR 7195
22 CHIAPAS 6217
23 DURANGO 6029
24 TLAXCALA 6001
25 QUERETARO 5848
26 CAMPECHE 5442
27 AGUASCALIENTES 5319
28 MORELOS 5035
29 ZACATECAS 4853
30 NAYARIT 4754
31 COLIMA 3413

O representarlo en una gráfica de barras.

También podemos agrupar los casos confirmados por día y su acumulado.

FECHA TOTAL TOTAL_ACCU
0 2020-01-13 00:00:00 1 1
1 2020-01-29 00:00:00 1 2
2 2020-02-06 00:00:00 1 3
3 2020-02-19 00:00:00 1 4
4 2020-02-21 00:00:00 1 5
5 2020-02-22 00:00:00 2 7
6 2020-02-23 00:00:00 1 8
7 2020-02-25 00:00:00 1 9
8 2020-02-26 00:00:00 1 10
9 2020-02-27 00:00:00 2 12
10 2020-02-28 00:00:00 2 14
11 2020-02-29 00:00:00 2 16
12 2020-03-01 00:00:00 6 22
13 2020-03-02 00:00:00 8 30
14 2020-03-03 00:00:00 6 36
15 2020-03-04 00:00:00 7 43
16 2020-03-05 00:00:00 7 50
17 2020-03-06 00:00:00 10 60
18 2020-03-07 00:00:00 21 81
19 2020-03-08 00:00:00 21 102
20 2020-03-09 00:00:00 64 166
21 2020-03-10 00:00:00 50 216
22 2020-03-11 00:00:00 51 267
23 2020-03-12 00:00:00 60 327
24 2020-03-13 00:00:00 88 415
25 2020-03-14 00:00:00 91 506
26 2020-03-15 00:00:00 100 606
27 2020-03-16 00:00:00 133 739
28 2020-03-17 00:00:00 111 850
29 2020-03-18 00:00:00 123 973
30 2020-03-19 00:00:00 113 1086
31 2020-03-20 00:00:00 183 1269
32 2020-03-21 00:00:00 132 1401
33 2020-03-22 00:00:00 141 1542
34 2020-03-23 00:00:00 222 1764
35 2020-03-24 00:00:00 182 1946
36 2020-03-25 00:00:00 211 2157
37 2020-03-26 00:00:00 249 2406
38 2020-03-27 00:00:00 289 2695
39 2020-03-28 00:00:00 276 2971
40 2020-03-29 00:00:00 266 3237
41 2020-03-30 00:00:00 387 3624
42 2020-03-31 00:00:00 311 3935
43 2020-04-01 00:00:00 466 4401
44 2020-04-02 00:00:00 440 4841
45 2020-04-03 00:00:00 445 5286
46 2020-04-04 00:00:00 454 5740
47 2020-04-05 00:00:00 434 6174
48 2020-04-06 00:00:00 587 6761
49 2020-04-07 00:00:00 517 7278
50 2020-04-08 00:00:00 630 7908
51 2020-04-09 00:00:00 635 8543
52 2020-04-10 00:00:00 969 9512
53 2020-04-11 00:00:00 733 10245
54 2020-04-12 00:00:00 781 11026
55 2020-04-13 00:00:00 974 12000
56 2020-04-14 00:00:00 917 12917
57 2020-04-15 00:00:00 1057 13974
58 2020-04-16 00:00:00 1040 15014
59 2020-04-17 00:00:00 1184 16198
60 2020-04-18 00:00:00 1278 17476
61 2020-04-19 00:00:00 1152 18628
62 2020-04-20 00:00:00 1875 20503
63 2020-04-21 00:00:00 1234 21737
64 2020-04-22 00:00:00 1271 23008
65 2020-04-23 00:00:00 1323 24331
66 2020-04-24 00:00:00 1571 25902
67 2020-04-25 00:00:00 1631 27533
68 2020-04-26 00:00:00 1456 28989
69 2020-04-27 00:00:00 1782 30771
70 2020-04-28 00:00:00 1569 32340
71 2020-04-29 00:00:00 1418 33758
72 2020-04-30 00:00:00 1971 35729
73 2020-05-01 00:00:00 2672 38401
74 2020-05-02 00:00:00 1927 40328
75 2020-05-03 00:00:00 1831 42159
76 2020-05-04 00:00:00 2332 44491
77 2020-05-05 00:00:00 2350 46841
78 2020-05-06 00:00:00 2110 48951
79 2020-05-07 00:00:00 2352 51303
80 2020-05-08 00:00:00 2719 54022
81 2020-05-09 00:00:00 2416 56438
82 2020-05-10 00:00:00 3254 59692
83 2020-05-11 00:00:00 3012 62704
84 2020-05-12 00:00:00 2720 65424
85 2020-05-13 00:00:00 2655 68079
86 2020-05-14 00:00:00 2670 70749
87 2020-05-15 00:00:00 3936 74685
88 2020-05-16 00:00:00 3003 77688
89 2020-05-17 00:00:00 2867 80555
90 2020-05-18 00:00:00 4125 84680
91 2020-05-19 00:00:00 3221 87901
92 2020-05-20 00:00:00 4396 92297
93 2020-05-21 00:00:00 3042 95339
94 2020-05-22 00:00:00 3847 99186
95 2020-05-23 00:00:00 3550 102736
96 2020-05-24 00:00:00 3337 106073
97 2020-05-25 00:00:00 5021 111094
98 2020-05-26 00:00:00 3680 114774
99 2020-05-27 00:00:00 3517 118291
100 2020-05-28 00:00:00 3997 122288
101 2020-05-29 00:00:00 4061 126349
102 2020-05-30 00:00:00 3905 130254
103 2020-05-31 00:00:00 3644 133898
104 2020-06-01 00:00:00 6612 140510
105 2020-06-02 00:00:00 4136 144646
106 2020-06-03 00:00:00 4096 148742
107 2020-06-04 00:00:00 4248 152990
108 2020-06-05 00:00:00 5244 158234
109 2020-06-06 00:00:00 4934 163168
110 2020-06-07 00:00:00 4186 167354
111 2020-06-08 00:00:00 5571 172925
112 2020-06-09 00:00:00 4521 177446
113 2020-06-10 00:00:00 6073 183519
114 2020-06-11 00:00:00 4407 187926
115 2020-06-12 00:00:00 5155 193081
116 2020-06-13 00:00:00 4591 197672
117 2020-06-14 00:00:00 4456 202128
118 2020-06-15 00:00:00 6853 208981
119 2020-06-16 00:00:00 5152 214133
120 2020-06-17 00:00:00 4454 218587
121 2020-06-18 00:00:00 5437 224024
122 2020-06-19 00:00:00 5545 229569
123 2020-06-20 00:00:00 7162 236731
124 2020-06-21 00:00:00 4579 241310
125 2020-06-22 00:00:00 5849 247159
126 2020-06-23 00:00:00 5080 252239
127 2020-06-24 00:00:00 5024 257263
128 2020-06-25 00:00:00 5986 263249
129 2020-06-26 00:00:00 6490 269739
130 2020-06-27 00:00:00 5087 274826
131 2020-06-28 00:00:00 6074 280900
132 2020-06-29 00:00:00 6436 287336
133 2020-06-30 00:00:00 6392 293728
134 2020-07-01 00:00:00 8101 301829
135 2020-07-02 00:00:00 5922 307751
136 2020-07-03 00:00:00 6367 314118
137 2020-07-04 00:00:00 5580 319698
138 2020-07-05 00:00:00 6097 325795
139 2020-07-06 00:00:00 6769 332564
140 2020-07-07 00:00:00 6136 338700
141 2020-07-08 00:00:00 5626 344326
142 2020-07-09 00:00:00 5735 350061
143 2020-07-10 00:00:00 8721 358782
144 2020-07-11 00:00:00 5607 364389
145 2020-07-12 00:00:00 5922 370311
146 2020-07-13 00:00:00 7154 377465
147 2020-07-14 00:00:00 5962 383427
148 2020-07-15 00:00:00 7515 390942
149 2020-07-16 00:00:00 5965 396907
150 2020-07-17 00:00:00 6703 403610
151 2020-07-18 00:00:00 6660 410270
152 2020-07-19 00:00:00 5897 416167
153 2020-07-20 00:00:00 9186 425353
154 2020-07-21 00:00:00 5560 430913
155 2020-07-22 00:00:00 5526 436439
156 2020-07-23 00:00:00 5393 441832
157 2020-07-24 00:00:00 5883 447715
158 2020-07-25 00:00:00 6824 454539
159 2020-07-26 00:00:00 5137 459676
160 2020-07-27 00:00:00 6625 466301
161 2020-07-28 00:00:00 5459 471760
162 2020-07-29 00:00:00 4654 476414
163 2020-07-30 00:00:00 4784 481198
164 2020-07-31 00:00:00 5016 486214
165 2020-08-01 00:00:00 7383 493597
166 2020-08-02 00:00:00 4819 498416
167 2020-08-03 00:00:00 5736 504152
168 2020-08-04 00:00:00 4455 508607
169 2020-08-05 00:00:00 5109 513716
170 2020-08-06 00:00:00 4340 518056
171 2020-08-07 00:00:00 4807 522863
172 2020-08-08 00:00:00 4946 527809
173 2020-08-09 00:00:00 4078 531887
174 2020-08-10 00:00:00 6562 538449
175 2020-08-11 00:00:00 4126 542575
176 2020-08-12 00:00:00 4021 546596
177 2020-08-13 00:00:00 3892 550488
178 2020-08-14 00:00:00 4312 554800
179 2020-08-15 00:00:00 4339 559139
180 2020-08-16 00:00:00 3273 562412
181 2020-08-17 00:00:00 3461 565873
182 2020-08-18 00:00:00 2817 568690
183 2020-08-19 00:00:00 1866 570556
184 2020-08-20 00:00:00 1567 572123
185 2020-08-21 00:00:00 874 572997
186 2020-08-22 00:00:00 409 573406
187 2020-08-23 00:00:00 350 573756
188 2020-08-24 00:00:00 124 573880
189 2020-08-25 00:00:00 8 573888

No solo podemos revisar los casos confirmados también ver el número de fallecimientos por día y su acumulado.

Antes de las visualizaciones observamos otra inconsistencia en sujetos que tienen registrada una fecha de defunción pero antes de que se registrará la fecha de los sintomas o personas con fecha de fallecimiento antes de los primeros casos de COVID-19 en México.

Comó se menciono anteriormente, esto puede ser por un error al registrar los datos.

FECHA_ACTUALIZACION ID_REGISTRO ORIGEN SECTOR ENTIDAD_UM SEXO ENTIDAD_NAC ENTIDAD_RES TIPO_PACIENTE FECHA_INGRESO FECHA_SINTOMAS FECHA_DEF INTUBADO NEUMONIA
358725 2020-08-26 14ca54 2 IMSS 11 HOMBRE GUANAJUATO GUANAJUATO HOSPITALIZADO 2020-02-11 2020-02-11 2020-03-01 SI SI
622884 2020-08-26 1731ab 1 IMSS 9 MUJER MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-05-24 2020-05-24 2020-04-13 NO SI
1225102 2020-08-26 009132 1 IMSS 27 HOMBRE TABASCO TABASCO HOSPITALIZADO 2020-07-29 2020-07-29 2020-06-29 NO SI
1240707 2020-08-26 1c2b09 2 IMSS 11 HOMBRE GUANAJUATO GUANAJUATO HOSPITALIZADO 2020-07-26 2020-07-26 2020-06-27 NO SI

Una manera de visualizar los datos de confirmados y fallecimientos es mediante un gráfico de área ya que en este caso los fallecimientos contados son un grupo de los sujetos confirmados y podemos comparar su proporción.

O gráficar con barras para cada día.

Preguntas que podemos explorar

Utilizando los datos de los casos confirmados, ¿Cuántos ingresaron en hospitales?

Para esto ocupamos la columna TIPO_PACIENTE que contiene valores como Hospitalizado que significa que esta o estuvo presente en un Hospital y Ambulatoria que significa que fue confirmado con COVID-19 pero que no ingreso a un hospital.

Seleccionando a los sujetos confirmados con COVID-19 y que se ingresaron en algún hospital, ¿Cuántos fueron entubados?

Para responder esto ocupamos la columna INTUBADO en la que se señala si el sujeto tuvo que ser intubado como un signo de la complicación de la enfermedad.

TIPO_PACIENTE SEXO CONTEOS
0 AMBULATORIA HOMBRE 211666
1 AMBULATORIA MUJER 214708
2 HOSPITALIZADO HOMBRE 90033
3 HOSPITALIZADO MUJER 57481

Podemos ocupar un gráfico de box plot para saber la distribución de la edad de las personas confirmadas que se encontraron en el hospital.

Podemos crear rangos de edad y observar que grupo es el que ha presentado más casos que requieran hospitalización.

En México siempre se ha mantenido las "noticias" acerca de que los hospitales se encuentran llenos y hemos visto las conferencias acerca de la expansión en hospitales dependendiendo de la situación que se encuentran los Estados. Lamentablemente, con los datos que estamos trabajando en este momento no hay información de esta capacidad en hospitales pero si podemos visualizar el número de personas que se encontraron en los distintos tipos de hospitales.

Commorbilidades

Otro problema que existe en México son las enfermedades que complican la condición del paciente con COVID-19. Entre las más importantes se encuentran Obesidad, Diabetes e Hipertensión. Observando los datos registrados hasta 2016, México presenta un crecimiento en el porcentaje de adultos con obesidad cada año. La siguente gráfica muestra el porcentaje en distintos paises desde 1975 al 2016, incluyendo Mexico.

Ahora en relación con COVID-19, podemos ver el número de personas confirmadas, saber si presentan obesidad y su condición en el hospital.

La misma situación pero con las otras dos cormobilidades, Diabetes e hipertension que estan estrechamente relacionadas con la Obesidad.

Siguiendo el interés de las co-morbilidades podemos clasificar cada paciente con el número de las enfermades que se mencionaron anteriormente ya que son las que presentaron y presentan un mayor riesgo.

Hasta el momento, solo hemos explorado los datos de las personas confirmadas con COVID-19 desde el inicio de la pandemia en México, no las personas que actualmente presentan la enfermedad.

Usando el número de personas confirmadas con COVID19 y con la población total de cada Estado (datos de 2017) podemos determinar el número total de fallecimientos en cada Estado por cada 100 000 habitantes.

O la otra manera que podemos ver los lamentables fallecimientos es por el total de confirmados de COVID-19 en cada Estado. No es la forma más adecuada de ver estos datos, ya que como han explicado, depende mucho del número de pruebas que se hacen. Por lo que muchas pruebas solo reduciría la proporción de fallecimientos por total de confirmados. Pero puede ser útil para ver algúna localidad en la que la proporcion de falleciemientos aumente y tratar de determinar las posibles causas.

Otra manera de ver la relación entre el número de fallecimientos y el número de confirmados mediante un gráfico denominado scatterplot en el que cada punto representa una entidad Federativa.

El siguiente gráfico muestra los casos confirmados en cada Estado desde el inicio de la pandemia en México hasta el día de hoy.

Ya que los datos presentan tanto el Estado como el minicipio podemos realizar un gráfico denominado treemap que nos permite observar los casos totales por localidad y el tamaño de los cuadros es por número correspondiente.

En el caso de los Recuperados, según los informes de la Secretaría de Salud, son los casos después de 15 días al inicio de los síntomas.

Si seleccionamos los casos confirmados de las últimas dos semanas tendríamos los casos que se consideran activos ya que se toma en cuenta que la enfermedad tiene una duración promedio de 14 días. Puede ser que esta restricción no contemple todos los activos ya que pueden existir casos en los que la recuperación sea lenta sin embargo, una alta proporcion de los casos activos se encuentran con el criterio tomado.

Podemos ocupar estos casos activos para generar un treemap.

Casos Por día

Una manera de poder ver el número de casos nuevos por dia es usando un heatmap en que podemos ver el crecimiento de casos por cada 100K personas del Estado. Para poder apreciar mejor el número de casos se calcula el logaritmo base 10. La idea original de esta visualización la puedes encontrar en el siguente artículo:

https://towardsdatascience.com/visualization-of-covid-19-new-cases-over-time-in-python-8c6ac4620c88

Duración epidémica

También es posible explorar la duración de la epidemia COVID19 en cada uno de los Estados. Esto quiere decir tomar el registro de cuando se dio el primer caso confirmado de COVID19 en cada uno de los Estados y continuar el lapso hasta el último día en el que se registro una confirmació. De esta manera podremos ver si algún Estado ha dejado de tener casos.

Debido a los errores al momento de registrar los datos, como se mencionó anteriormente, se tomarán en cuenta solo los datos a partir de inicios de Marzo 2020 que fue de las fechas oficiales.

Teniendo en cuenta este último gráfico, podemos revisar por día como fueron los distintos casos (no acumulados).

El siguente calendario muestra la intensidad de los casos confirmados en todo México por día. Es necesario considerar que debido a los errores de anotación que se describieron anteriormente el calendario iniciaria en Enero y Febrero cuando no en realidad no fue asi. Sin embargo, no se eliminaron ya que cuentan como casos postivos.

También es posible revisar los casos recuperados y observarlos en un calendario.

Y por último los fallecimientos por día.